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fi 2: [目的 / 意义 ] 探 究 科 学 数据 价值 增值 影响 因素 ， 揭 示 科 ; 


学 数据 价值 增值 内 在 发 展 规律 。 [方法 / 过 程 ] 基 于 专家 访谈 


资料 和 文献 中 科学 数据 价值 增值 相关 内 容 ， 采 用 扎根 理论 方法 ， 


得 到 科学 数据 价值 增值 影响 因素 的 理论 模型 。 在 此 基础 上 ， 


建立 科学 数据 价值 增值 系统 动力 学 模型 ， 对 科学 数据 价值 增值 的 


过 程 进行 动态 模拟 仿真 与 分 析 ， 揭 示 各 影响 因素 对 科学 数据 


， 原 始 数 据 质量 是 前 提 条 件 ， 数 据 存 缴 水 平 景 


S 


向 显著 ， 数 据 组 


价值 增值 的 作用 关系 。 [结果 / 结论 ] 科学 数据 价值 增值 过 程 


织 与 整合 是 价值 增值 形成 的 关键 ， 科 学 数据 共享 与 开发 是 价值 增 


SN 


实现 的 关键 。 
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1 引言 


在 数据 密集 型 科研 范式 背景 下 ， 科 学 数据 成 为 驱 
动 科技 进步 与 知识 创新 的 重要 基石 ， 逐 渐 成 为 各 国 科 
技 竞 争 的 新 战略 高 地 ， 科 学 数据 价值 受到 前 所 未 有 的 
关注 与 重视 。《 中 共 中 央 国 务 院 关于 构建 更 加 完善 的 
要 素 市 场 化 配置 体制 机 制 的 意见 》 进 一 步 明确 提出 ， 
“加 快 培育 数据 要 素 市 场 ”“ 提 升 数据 资源 价值 ”， 为 
挖掘 科学 数据 价值 指明 方向 。 


报 学 报 , 2023, 35 (9) : 


实践 趁势 而 兴 。 为 了 提高 科学 数据 开放 水 平 ， 国 际 上 
许多 国家 和 地 区 围绕 科学 数据 开放 共享 制定 了 千 干 政 
策 、 法 规 和 指南 。 如 美国 科学 与 技术 政策 办 公 室 发 布 
的 《促进 科学 研究 成 果 获 取 备 忘 录 》 凹 、 欧 盟 《 开 放 数 
据 和 公共 信息 再 利用 指令 》 巴 、 中 国 的 《科学 数据 管理 
办 法 》 等 ， 这 些 政策 要 求 公 共 资 助 产 生 的 科学 数据 实 
行 公开 为 常态 ， 不 公开 为 例外 的 原则 面向 社会 提供 开 
放 共 享 。 为 了 推进 科学 数据 的 规范 管理 进而 提高 科学 
数据 应 用 价值 ， 国 际 社会 于 2014 年 在 荷兰 莱 顿 举办 的 
学 术 会 议 上 提出 了 科学 数据 FAIR (可 发 现 、 可 访问 、 


开放 科学 运动 的 发 展 ， 推 动 了 科学 数据 开放 共享 
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得 到 国际 社会 的 广泛 认可 ， 许 多 国家 和 组 织 将 其 运用 
于 科学 数据 开放 共享 实践 ， 为 促进 科学 数据 质量 提升 
提供 有 力 支 撑 。 在 基础 设施 方面 ， 各 国 不 断 升级 科学 
数据 共享 平台 ,已 形成 了 综合 型 、 领 域 型、 机 构 型 等 
多 种 类 型 科学 数据 平台 ， 如 美国 的 “开放 科学 中 心 ” 
(COS) 、 澳 大 利 亚 的 “研究 数据 共享 基础 设施 ” 
(ARDC) 项 目 、 欧 洲 的 “欧洲 开放 科学 云 ” (EOSC) 
项 目 ， 中 国 各 学 科 领 域 学 科 数 据 共享 基础 设施 也 逐渐 
完善 ， 目 前 已 形成 20 个 国家 科学 数据 中 心 上 8。 这 些 科 
学 数据 共享 平台 的 搭建 ， 为 科学 数据 价值 的 实现 提供 
了 有 力 抓 手 。 在 科学 数据 管理 服务 方面 ， 国 外 许多 高 
校 已 经 建立 起 集中 的 科研 数据 管理 (Research Data 
Management, RDM) 服务 来 为 研究 人 员 提 供 文 持 ， 如 
英国 剑桥 大 学 提出 的 数据 拥护 者 计划 ， 通 过 在 部 门 或 
学 院 设立 本 地 的 数据 拥护 者 来 推广 良好 的 数据 管理 实 


践 9。 总 体 而 言 ， 目 前 国内 外 科学 数据 开放 共享 实践 主 
要 围绕 政策 制定 、 平 台 建 设 、 数 据 管 理 服 务 等 方面 展 


开 ， 这 些 实践 扩大 了 科学 数据 开放 规模 、 提 升 了 科学 
数据 质量 ， 有 力 地 推动 了 科学 数据 价值 实现 。 

作为 开放 科学 关键 要 素 ， 科 学 数据 开放 共享 已 形 
成 国际 共识 ， 科 学 数据 资源 建设 、 管 理 与 开发 工作 初 
见 成 效 。 但 总 体 而 言 ， 当 前 科学 数据 管理 普遍 存在 
“ 重 数量 轻 质 量 、 重 开放 轻 增 值 ”现象 ha， 在 科学 数据 
质量 、 科 学 数据 重用 等 方面 面临 越 来 越 严 峻 的 挑战 ， 
严重 影响 科学 数据 要 素 作用 的 发 挥 和 科学 数据 价值 实 
现 。 科 学 数据 价值 问题 是 数据 管理 的 本 源 问题 ， 是 文 
配 科学 数据 开放 共享 的 主线 中。 因此 ， 在 科学 数据 开放 
共享 实践 发 展 的 当下 ， 围 绕 科 学 数据 价值 增值 这 一 核 
心 问题 展开 探讨 恰 逢 其 时 。 


2 相关 研究 成 果 


现 有 数据 价值 的 研究 主要 关于 数据 价值 形成 或 实 
现 。 从 经 济 学 的 角度 ， 李 海 建 等 认为 数据 质量 程度 、 
加 工程 度 、 使 用 程度 、 连 接 程 度 、 应 用 场景 、 开 放 程 


用 云 计算 等 开放 技术 处 理 数据 ， 能 够 提升 开放 数据 价 


IAW, EER, RAE 
科学 数据 价值 增值 影响 因素 系统 动力 学 仿真 研究 


值 中 ， 从 数据 组 织 与 加 工 角 度 ，PETR 等 认为 大 数据 的 
可 发 现 程度 及 元 数据 质量 影响 大 数据 价值 四 ; 2 LE 
等 提出 大 数据 的 价值 源 于 其 蕴含 的 各 种 知识 关联 ， 大 
数据 价值 的 核心 在 于 对 知识 关联 进行 刻画 、 揭 示 和 利 
用 凸 。 关 于 数据 要 素 价 值 的 实现 ， 马 费 成 等 认为 数据 
采集 是 数据 要 素 价值 实现 源头 ， 数 据 组织 是 数据 价值 
开放 的 重要 环节 ， 数 据 流通 是 关键 ,数据 利用 是 价值 
实现 的 “最 后 一 公里 ”中 ; 夏 义 荤 等 着 重 考虑 数据 要 
素 主体 、 客 体 与 环境 3 个 维度 探讨 了 数据 要 素 价 值 影响 
因素 ， 并 在 此 基础 上 提出 了 数据 要 素 价值 提升 路 径 吕 。 
关于 科学 数据 价值 研究 ， 学 者 们 主要 围绕 价值 标 
准 、 价 值 实现 策略 等 展开 理论 探讨 。 邓 君 等 提出 了 科 
学 数据 价值 鉴定 的 原则 与 标准 外。 顾 立 平等 从 图 书馆 
业务 实践 角度 ， 提 出 科学 数据 价值 提升 的 理论 框架 中, 
孙 建 军 等 提出 科学 大 数据 价值 链 应 以 科学 大 数据 资源 
为 基 、 以 科学 大 数据 管理 为 力 、 以 科学 大 数据 挖掘 为 
核 、 以 科学 大 数据 服务 为 标 中 。 冯 媛 基于 价值 共 创 理 
论 视角 ， 分 析 了 科学 数据 开放 共享 的 价值 流 和 多 元 主 
体 互动 关系 ， 提 出 价值 共 创 模型 四。 任 颖 等 构建 了 科 
学 数据 价值 共 创 系统 ， 认 为 科学 数据 价值 共 创 主体 和 
其 系统 互动 程度 ， 以 及 政治 、 经 济 、 文 化 和 技术 等 环 
境 因素 共同 影响 科学 数据 价值 共 创 中。 
总 体 而 言 ， 科 学 数据 开发 利用 与 价值 实现 一 直 是 
学 界 关 注 热点 。 现 有 相关 研究 大 多 从 科学 数据 价值 主 
体 、 客 体 、 环 境 等 维度 探讨 科学 数据 价值 实现 ， 且 以 吏 
态 的 、 理 论 分 析 为 主 。 科 学 数据 价值 增值 是 价值 实现 的 
进一步 延伸 ， 涉 及 科学 数据 全 生命 周期 过 程 ， 需 要 动态 
地 、 全 局 性 地 剖析 科学 数据 价值 增值 规律 。 因 此 ， 本 研 
究 运 用 扎根 理论 识别 科学 数据 价值 增值 影响 因素 ， 并 
运用 动力 学 方法 进行 仿真 分 析 ， 通 过 模拟 影响 因素 的 
作用 过 程 及 效应 ， 揭 示 科 学 数据 价值 增值 内 在 规律 。 


3 科学 数据 价值 增值 内 涵 及 路 径 分 析 


3.1 科学 数据 价值 增值 概念 内 酒 


现 有 文献 中 ， 顾 立 平等 认为 数据 价值 提升 是 通过 
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著录 、 标 引 、 建 立 知识 关联 等 规范 的 组 织 和 管理 使 科 


数据 生产 者 在 科研 过 程 中 产生 原始 科学 数据 。 原 始 科 


学 数据 从 无 序 转 为 有 序 ， 使 科学 数据 中 隐藏 的 信息 被 
挖掘 出 来 ， 从 而 创造 更 大 的 科研 价值 中。 任 福 兵 等 提 
出 政府 开放 数据 价值 增值 是 对 数据 资源 的 进一步 整合 
与 开发 ， 形 成 个 性 化 的 增值 产品 或 服务 的 活动 中 。 显 
然 ， 前 者 的 价值 提升 侧重 数据 资源 的 组 织 管理 过 程 ， 
后 者 的 价值 增值 强调 数据 资源 的 开发 利用 。 本 研究 认 
为 在 当前 科学 数据 开放 共享 背景 下 ， 科 学 数据 价值 增 
值 应 着 眼 于 科学 数据 的 全 生命 周期 ， 即 在 科学 数据 生 
成 、 存 储 、 组 织 、 开 放 共享 、 开 发 利用 等 全 生命 周期 
过 程 中 ， 相 关 利 益 主 体 通过 管理 手段 以 及 数据 加 工 技 
术 ， 提 升 科 学 数据 价值 效应 、 激 发 科学 数据 的 潜在 价 
值 或 产生 增值 数据 产品 或 服务 。 


3.2 科学 数据 价值 增值 路 径 分 析 


借鉴 信息 价值 链 理论 外， 科学 数据 价值 增值 不 仅 
仪 是 各 类 数据 管理 活动 的 简单 个 加， 而 是 相关 利益 主 
体 紧 密 协 同 ， 促 进 各 参与 者 之 间 资 源 、 信 息 、 能 力 充 
分 流通 及 创新 整合 ， 进 而 实现 科学 数据 价值 增值 。 开 
放 科学 数据 背景 下 ， 伴 随 科学 数据 流 由 “原始 科学 交 
据 -集中 存储 的 科学 数据 - 公开 的 科学 数据 - 增值 科学 
数据 与 服务 ”的 变化 ， 科 学 数据 价值 形态 实现 了 由 低 
价值 到 高 价值 的 价值 增值 过 程 (图 1)。 

(1) 科学 数据 生成 阶段 。 科 研 人 员 或 科研 团队 等 


学 数据 质量 是 后 续 管理 与 开发 利用 的 基础 ， 同 时 ， 这 
一 阶段 科学 数据 生产 者 掌控 数据 ， 科 学 数据 贮存 在 数 
据 生 产 者 个 人 设备 中 ， 科 学 数据 的 价值 效能 有 限 。 

(2) 科学 数据 集中 存储 阶段 。 原 始 科 学 数据 或 机 
构 内 部 聚合 的 科学 数据 进一步 汇 交 至 科学 数据 中 心 或 
科学 数据 出 版 发 行 平台 ， 由 科学 数据 中 心 等 对 汇 交 的 
科学 数据 进行 集中 存储 。 科 学 数据 从 私 域 走向 第 三 方 ， 
科学 数据 的 安全 性 、 可 靠 性 等 得 到 一 定 程 度 提升 。 

(3) 科学 数据 组 织 整合 阶段 。 原 始 科 学 数据 或 机 
构 内 部 聚合 的 科学 数据 进一步 汇 交 至 科学 数据 中 心 或 
科学 数据 出 版 发 行 平台 ， 由 专业 人 员 对 科学 数据 进行 
质量 审核 ， 对 通过 审核 的 科学 数据 进行 规范 化 处 理 ， 
赋予 高 质量 元 数据 ， 再 将 经 过 深度 刻画 和 揭示 的 科学 
数据 建立 知识 关联 ， 然 后 向 公众 开放 。 这 一 阶段 使 得 
科学 数据 质量 、 可 信和 度 、 交 互 性 等 得 到 提升 BIER 
据 价值 进一步 提高 。 

(4) 科学 数据 开发 阶段 。 科 学 数据 开放 共享 后 ， 
更 多 的 社会 机 构 和 组 织 可 以 参与 对 科学 数据 的 创新 整 
合 、 开 发 利用 。 数 据 研发 机 构 根 据 用 户 需求 ， 采 取 智 
能 化 手段 对 科学 数据 进行 二 次 开发 ， 形 成 增值 数据 产 
品 。 数 据 运营 机 构 针对 市 场 需求 ， 打 造 个 性 化 科学 妆 
据 服务 ， 形 成 科学 衍生 价值 。 


科学 数据 低 价值 高 价值 
价值 
科学 原始 的 集中 存储 的 公开 的 |_ | 增值 的 科学 
数据 形态 科学 数据 ”科学 数据 ”| 科学 数据 | |， “| 数据 与 服务 
科学 数据 | 。 科学 数据 生成 ”| 。 科学 数据 汇 交 科学 数据 。 ;科学 数据 
活动 组 织 与 整合 开发 
科学 数据 科研 人 员 科研 团 也 | 科学 数据 管理 中 心 | 科学 数据 管理 中 心 
主体 科研 机 构 科研 机 构 i 科学 数据 出 版 社 “| 数据 研发 机 构 
科研 团队 | 数据 运营 机 构 


图 1 科学 数据 价值 增值 路 径 
Fig.l The path of adding value of scientific data 
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4 科学 数据 价值 增值 影响 因素 识别 


4.1 研究 方法 


已 有 研究 成 果 中 关于 科学 数据 价值 增值 影响 因素 
直接 研究 成 果 较 少 ， 缺 少 可 以 直接 采用 或 借鉴 的 成 熟 
理论 。 本 研究 将 采用 扎根 理论 识别 科学 数据 价值 增值 
的 影响 因素 。 扎 根 理论 是 一 种 较为 严谨 的 质 性 研究 方 
法 ,适用 于 从 复杂 的 质 性 材料 中 构建 理论 模型 趾 。 与 
量化 研究 呈 相 反方 向 ， 扎 根 理论 研究 是 直接 从 数据 着 手 ， 
逐 级 抽象 和 归纳 形成 理论 ， 是 自 下 而 上 的 研究 过 程 。 


4.2 数据 获取 


扎根 理论 强调 样本 资料 的 全 面 性 和 代表 性 ， 重 视 
样本 资料 来 源 的 广度 与 深度 。 因 此 ， 本 研究 综合 采用 
专家 访谈 、 文 献 收集 方式 获取 样本 资料 。 通 过 对 专家 
经 验 和 已 有 文献 中 相关 信息 的 整理 、 归 纳 、 抽 象 ， 最 
终 形 成 科学 数据 价值 增值 影响 因素 的 理论 模型 。 

4.2.1 访谈 数据 获取 

为 了 避免 访谈 中 可 能 出 现 的 “ 霍 桑 效应 ” ， 本 研究 
在 访谈 过 程 遵循 MYERS 等 提出 的 规范 性 访谈 框架 四。 
为 了 确保 访谈 提纲 没有 歧义 ， 更 容易 被 访谈 对 象 理解 ， 
本 研究 进行 了 预 访谈 ， 并 根据 预 访谈 中 出 现 的 问题 ， 
对 访谈 提纲 的 相关 表述 进行 优化 。 最 终 访谈 提纲 主要 
包含 以 下 问题 ，Q@ 主 要 通过 哪些 途径 生成 /采集 科研 数 
据 ? 此 过 程 有 哪些 困难 ?名 是 否 愿意 通过 提交 至 数据 
中 心 或 数据 期 刊 等 方式 开放 共享 科学 数据 ? @ 科 学 数 
据 加 工 组 织 过 程 ， 有 哪些 关键 环节 ， 哪 些 因 素 会 影响 
数据 价值 增值 ? 科学 数据 开放 利用 过 程 ， 哪 些 因素 
可 能 影响 科学 数据 价值 增值 ?在 访谈 开始 前 ,访谈 人 
员 需 要 向 访谈 对 象 解释 访谈 目的 和 主题 ， 作 出 保密 承 
诺 ， 并 就 访谈 录音 征 得 对 方 同意 。 在 访谈 过 程 中 ， 根 
据 访谈 对 象 数据 角色 不 同 及 访谈 具体 情境 ， 对 具体 问 
题 的 表述 适当 调整 。 

访谈 工作 主要 集中 在 2022 年 10 一 11 月 期 间 ， 一 
共 选 取 了 具有 科学 数据 生成 和 利用 经 历 的 科研 人 员 13 
名 ， 以 及 某 省 科学 数据 资源 统筹 中 心 相 关 工 作 人 员 5 


PMA, EEA, RAE 
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名 参与 专家 访谈 。 经 访谈 对 象 同意 将 访谈 录音 转录 ， 
共 形 成 访谈 文本 3 万 余 字 。 随 机 抽取 其 中 13 份 访谈 文 
本 进行 编码 分 析 ， 其 余 5 份 留 作 饱和 度 检 验 。 
4.2.2 文献 数据 获取 

2022 年 8 月 至 2022 年 12 月 期 间 ， 从 CNKI 及 
Web of Science 核心 集 数 据 中 检索 相关 文献 ， 最 终 选 取 
42 篇 与 本 研究 相关 的 文献 ， 随 机 选取 其 中 35 篇 进行 编 
码 ， 其 余 文 献 留 作 饱 和 度 检 验 。 


4.3 影响 因素 识别 


(1) 开放 性 编码 。 首 先 ， 对 所 获得 的 样本 资料 反 
复 研读 ， 熟 悉 将 要 编码 的 资料 内 容 ， 并 将 原始 样本 资 
料 逐 个 分 析 形 成 条 目 数 据 ， 完 成 初始 编码 。 接 着 ， 编 
码 小 组 结合 研究 主题 ， 通 过 反复 讨论 、 比 较 条 目 所 描 
述 的 内 容 与 科学 数据 价值 增值 的 相关 性 以 及 条 目 之 间 
的 可 区 分 性 等 原则 ， 对 初始 条 目 进行 合并 和 精简 ， 共 
形成 76 个 条 目 。 将 编码 人 员 分 为 A、B 编码 组 ， 在 不 
准 互 相 沟通 的 前 提 下 ， 分 别 根据 条 目 所 体现 的 内 容 进 
行 归 类 和 命名 。 再 由 A、B 组 编码 人 员 分 别 阐述 分 类 
和 命名 的 理由 ， 经 过 反复 研讨 ， 选 择 其 中 获得 课题 组 
一 致 通过 的 主题 概念 。 最 终 ， 通 过 对 获取 的 初步 概念 
进行 分 析 ， 将 含义 相同 、 相 似 或 相互 联系 的 概念 合 3 
于 相同 范畴 之 中 ， 形 成 20 个 范畴 。 由 于 篇 幅 所 限 ， 截 
图 部 分 开放 编码 过 程 如 表 1 所 示 。 

(2) 主轴 编码 。 通 过 剖析 初始 范畴 的 内 容 ， 将 相 
互 独立 的 范畴 联系 起 来 ， 发 展 形成 更 深层 的 主 范畴 。 本 
研究 基于 对 科学 数据 价值 增值 的 路 径 分 析 ， 结 合 开放 编 
码 结果 特点 ， 最 终 将 20 个 范畴 归纳 为 7 个 主 范畴 。 

(3) 选择 性 编码 。 对 主轴 式 编码 所 获得 的 主 范畴 
进行 系统 分 析 ， 选 取 具 有 统领 性 的 核心 范畴 。 同 时 ， 
深入 挖掘 核心 范畴 和 其 他 范畴 之 间 的 联系 ， 基 于 此 ， 
构建 能 够 反映 研究 现象 本 质 的 理论 框架 。 根 据 以 上 思 
想 ， 本 文 对 形成 的 6 个 主 范畴 进行 对 比 剖 析 ， 结 合 
“科学 数据 价值 增值 ”主题 ， 最 终 确定 科学 数据 价值 增 
影响 因素 表 。 

(4) 饱和 度 检验 。 理 论 饱和 度 是 一 个 主观 概念 ， 
到 目前 为 止 ， 尚 未 有 度量 理论 饱和 度 的 客观 指标 ， 需 
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表 1 部 分 开放 编码 过 程 


Table 1 Some ofthe open coding processes 


部 分 编码 内 容 ya 来 源 
如 果 没 有 强制 要 求 ， 我 不 愿意 去 汇 交 数据 ， 像 我 们 进行 科研 主要 为 了 发 论文 ， 获 得 一 些 成 果 ， 如 果 提 交 了 数据 ， 别 人 利 F2 
我 的 数据 可 以 抢先 发 表 成 果 (感知 风险 ) 
我 本 人 是 愿意 去 共享 或 者 说 去 汇 区 我 的 数据 资源 的 ， 但 是 有 时 候 汇 交 数 据 的 流程 比较 繁琐 ， 需 要 单位 层 层 审核 ， 还 需要 F3 
提交 许多 汇 交 材料 ， 就 导致 我 不 想 去 做 这 件 事 了 《感知 努力 ) 数据 汇 交 意愿 
据 我 了 解 ， 目 前 有 的 科学 数据 中 心 在 数据 汇 交 后 还 会 将 数据 出 版 或 者 发 布 ， 发 布 数据 就 像 论文 一 样 ， 一 定 程度 上 也 提升 F4 
了 研究 人 员 的 名 声 〈 感 知 利益 ) 


要 研究 者 根据 研究 经 验 的 感性 认识 进行 把 握 四 。 本 研 
究 采 用 预 留 的 5 份 访谈 内 容 及 7 篇 理论 文献 进行 概念 
比 对 ， 结 果 没 有 新 概念 或 理论 内 涵 出 现 ， 即 预 留 的 文 
本 内 容 基 本 被 此 前 的 20 个 概念 所 覆盖 。 根 据 此 种 情况 


就 我 而 言 ， 我 觉得 汇 交 数据 这 件 事 让 我 拥有 一 种 成 就 感 ， 实 现 了 科研 人 员 服 务 社会 的 一 种 责任 感知 成 就 ) FS 


进行 战略 和 策略 的 实验 名。 该 方法 可 以 处 理 复 杂 系 统 
的 建 模 问 题 ， 还 能 量化 调节 系统 各 要 素 之 间 的 关系 外。 
科学 数据 从 形成 、 存 储 、 组 织 、 共 享 ， 到 开发 利用 可 
以 视 为 一 个 有 机 联系 的 系统 ， 是 具有 系统 性 、 非 线性 


本 研究 认为 当前 访谈 结果 及 在 此 基础 上 形成 的 理论 已 
经 饱和 。 

(5) 信 度 检验 。 为 了 检验 上 述 归 类 是 否 恰 当 ， 本 
研究 借鉴 已 有 研究 的 “ 反 向 归 类 法 ”外 ， 请 未 参与 本 
研究 的 3 名 研究 生 在 理解 上 述 范畴 、 主 范畴 的 含义 后 ， 
将 76 个 条 目 分 别 归 到 对 应 的 类 别 中 。 反 向 归 类 的 结果 
显示 ，3 位 评判 者 都 将 该 条 目 归 类 预想 类 别 中 的 共有 
69 条 ， 有 两 位 评判 者 将 该 条 目 作 一 致 归 类 的 有 7 条 ， 
完全 不 一 致 的 条 目 为 0。 经 过 深入 讨论 发 现 导致 未 能 一 
致 归 类 的 原因 主要 是 对 “技术 因素 ” 主 范畴 及 其 对 应 
的 “ 数 智 技术 应 用 能 力 ” 范 畴 的 区 分 度 存疑 ， 一 名 评 
判 者 认为 该 项 类 别 的 内 容 已 体现 在 “数据 处 理 能 力 ” 
“数据 开发 能 力 ” 等 范畴 中 ， 与 这 两 项 类 目 区 分 度 不 
足 。 因 此 ， 删 除 该 主 范畴 及 对 应 范畴 ， 最 终 得 到 19 个 
范畴 ，6 个 主 范 畴 。 此 外 ， 随 机 选取 3 位 前 述 访谈 对 象 
对 其 所 描述 的 科学 数据 价值 增值 影响 因素 进行 归属 选 
择 ， 均 能 正确 对 应 。 通 过 上 述 反 向 回归 法 和 反馈 法 的 
验证 结果 表明 ， 以 上 扎根 理论 结果 具有 一 定 可 信和 度 。 
最 终 形成 科学 数据 价值 增值 影响 因素 如 表 2 所 示 。 


5 系统 动力 学 仿真 


系统 动力 学 是 研究 社会 系统 动态 行为 的 计算 机 仿 
真 方法 ， 将 社会 系统 模型 化 ， 再 输入 计算 机 模拟 仿真 ， 
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和 复杂 性 等 显著 特征 的 动态 反馈 系统 。 因 此 ， 运 用 系 
统 动力 学 构建 系统 仿真 模型 ， 抓 住 科学 数据 价值 增值 
的 关键 环节 ， 训 析 其 影响 因素 之 间 的 关键 联系 和 反馈 
回路 。 


5.1 系统 边界 确定 


明确 系统 边界 是 系统 动力 学 建 模 的 关键 。 本 研究 
以 科学 数据 价值 增值 过 程 为 研究 对 象 ， 围 绕 科学 数据 
价值 增值 过 程 的 相关 影响 因素 进行 研究 。 所 以 ， 本 研 
究 将 科学 数据 价值 增值 影响 因素 划 入 系统 边界 ， 包 括 
原始 数据 质量 因素 、 数 据 存 缴 因素 、 数 据 组 织 与 整合 
因素 、 数 据 共享 和 开发 因素 、 数 据 政策 与 监管 因素 、 
资金 保障 因素 等 6 个 子 系统 ， 每 个 子 系统 所 涉及 的 因 
素 之 间 存 在 复杂 的 动态 因果 关系 。 其 中 数据 存 缴 因素 
子 系统 中 ， 数 据 汇 交 意愿 对 其 有 较 大 影响 ， 为 了 进 一 
步 探析 数据 汇 交 意愿 的 作用 规律 ， 所 以 将 与 其 相关 的 
感知 风险 、 感 知 努 力 、 感 知 利益 、 感 知 成 就 纳入 该 子 
系统 。 


5.2 因果 反馈 关系 分 析 


本 研究 通过 因果 反馈 回路 图 描绘 出 科学 数据 价值 
增值 与 影响 因素 间 关 系 形成 的 动态 过 程 (图 2)。 经 过 
Vensim PLE 运行 ， 得 到 科学 数据 价值 增值 过 程 的 反馈 
回路 ， 详 见 表 3。 


IAW, EEA, RAE 
科学 数据 价值 增值 影响 因素 系统 动力 学 仿真 研究 


表 2 科学 数据 价值 增值 影响 因素 


Table 2 Influencing factors of scientific data value appreciation 


核心 范畴 主 范畴 范畴 TEWE A 
科研 人 员 数 据 素养 科研 人 员 在 数据 收集 、 处 理 、 使 用 等 过 程 中 体现 出 的 能 力 和 素养 
原始 数据 质量 数据 软 便 件 设施 科学 数据 采集 、 处 理 、 存 储 相 关 的 软 便 件 条 件 
aa 数据 服务 质量 科学 数据 管理 与 服务 单位 提供 科学 数据 相关 服务 的 质量 
RIAS 数据 汇 交 意愿 科研 人 员 等 科学 数据 生产 者 将 科学 数据 存 缴 至 数据 中 心 等 平台 , 提供 数据 共享 的 愿意 程度 
Spri 数据 审核 机 制 科学 数据 中 心 等 数据 存储 机 构 对 汇 交 的 科学 数据 按照 一 定 标准 规范 对 数据 进行 质量 审核 
的 机 制 
数据 存储 与 维护 机 制 ”科学 数据 中 心 等 数据 存储 机 构 对 科学 数据 进行 存储 、 备 份 、 恢 复 和 管理 的 相关 规范 和 流程 
元 数据 质量 科学 数据 的 元 数据 质量 水 平 
数据 组 织 与 整合 。 数据 处 理 能 力 科学 数据 中 心 等 科学 数据 管理 机 构 对 科学 数据 进行 分 类 、 描 述 、 转 化 等 处 理 活动 的 能 力 
eee 数据 整合 能 力 科学 数据 中 心 等 科学 数据 管理 机 构 对 不 同 领域 、 多 维度 科学 数据 建立 关联 的 能 
writs 数据 开放 规模 科学 数据 中 心 等 将 科学 数据 对 公众 开放 的 范围 、 对 使 用 者 的 约束 条 件 等 
pik 数据 开放 风险 科学 数据 开放 过 程 中 可 能 产生 的 负面 影响 
数据 共享 与 开发 。 ”数据 共享 平台 质量 科学 数据 共享 平台 功能 完善 程度 、 易 用 性 等 方面 的 质量 表现 
数据 共享 服务 能 科学 数据 中 心 等 数据 服务 机 构 提 供 科 学 数据 利用 过 程 相关 服务 的 能 力 水 平 
数据 开发 能 力 科学 数据 中 心 等 数据 服务 机 构 对 科学 数据 进行 二 次 开发 形成 新 的 数据 产品 或 服务 的 能 
数据 政策 完善 程度 有 关 科 学 数据 的 宏观 、 微 观 等 多 层面 政策 的 完备 程度 
数据 政策 与 监管 。 ”数据 评价 与 激励 机 制 ”对 科学 数据 质量 、 科 学 数据 管理 服务 等 方面 的 评价 与 激励 机 制 
保障 因素 数据 监管 机 制 对 科学 数据 进行 管理 和 监督 的 制度 、 程 序 和 措施 
ere 财政 支持 力度 政府 对 科学 数据 管理 活动 的 资金 支持 力度 
数据 价值 增值 收益 科学 数据 中 心 等 通过 科学 数据 价值 增值 所 获得 的 经 济 收益 
和 数据 软 硬 件 设施 
数据 服务 质量 
感知 努力 


感知 利益 + ”数据 汇 交 意愿 
一 


感知 成 就 -一 下 


FABRE p+ 


数据 处 理 


数据 组 织 与 整合 


数据 整合 能 力 


5.3 仿真 模型 构建 
53.1 系统 流 图 
基于 科学 数据 价值 增值 影响 因素 的 因果 关系 ， 本 ”过程 中 各 要 


$ 


Eg ———— 
e a Oe Oe 


财政 支持 力度 ”+ 


图 2 科学 数据 价值 增值 影响 因素 因果 关系 图 


Fig. 2 Causal diagram of the influencing factors of scientific data value appreciation 


人 研究 通过 Vensim PLE 工具 绘制 了 科学 数据 价值 增值 系 


统 流 图 ， 如 
相互 联系 、 


图 3 所 示 。 该 图 反映 了 这 4 类 变量 之 间 的 
相互 作用 方式 ， 揭 示 了 科学 数据 价值 增值 
素 之 间 的 作用 关系 。 
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表 3 科学 数据 价值 增值 反馈 回路 


Table 3 Feedback loop ofvalue-added scientific data 


回路 序号 反馈 类 型 回路 详情 
回路 1 正 反馈 数据 存 缴 一 数据 价值 增值 一 资金 保障 一 数据 存 缴 
回路 2 E 反 馈 数据 存 缴 一 数据 价值 增值 一 数据 政策 与 监管 一 数据 存 缴 
回路 3 FE 反馈 数据 共享 与 开发 一 数据 价值 增值 一 资金 保障 一 数据 共享 与 开发 
回路 4 E 反 馈 数据 组 织 与 整合 一 数据 价值 增值 一 资金 保障 一 数据 组 织 与 整合 
回路 5 E 反 馈 数据 组 织 与 整合 一 数据 价值 增值 一 数据 政策 与 监管 一 数据 组 织 与 整合 
回路 6 E 反 馈 数据 共享 与 开发 一 数据 价值 增值 一 数据 政策 与 监管 一 数据 共享 与 开发 
回路 7 E 反 馈 资金 保障 一 数据 组 织 与 整合 一 数据 价值 增值 一 资金 保障 
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图 3 科学 数据 价值 增值 


影响 因素 系统 流 


图 


Fig.3 Flow diagram of the value-added system of scientific data 


根据 图 3 可 知 ， 科 学 数据 价值 增值 系统 流 图 总 共 
涉及 36 个 变量 ,包括 6 个 水 平 变量 ，6 个 速率 变量 ， 


表 4 所 示 。 
5.3.2 基本 假设 


11 个 辅助 变量 ，13 个 常量 ， 具 体 变量 与 相应 的 含义 如 为 了 便于 数据 仿真 与 模拟 ， 需 对 科学 数据 价值 增 
表 4 变量 名 称 及 其 类 型 
Table 4 Variable names and types 
变量 类 型 变量 名 称 
状态 变量 原始 数据 质量 水 平 、 数 据 存 缴 水 平 、 数 据 组 织 与 整合 水 平 、 数 据 共享 与 开发 水 平 、 数 据 政策 与 监管 水 平 、 资 金保 障 水 平 
速率 变量 原始 数据 质量 水 平 变化 量 、 数 据 存 缴 水 平 变化 量 、 数 据 组 织 与 整合 水 平 变化 量 、 数 据 共 享 与 开发 水 平 变化 量 、 数 据 政策 与 监管 水 
平 变化 量 、 资 金保 障 水 平 变化 量 
辅助 变量 。 ”科学 数据 价值 增值 水 平 、 数 据 软 硬件 设施 、 数 据 汇 交 意愿 、 数 据 开放 风险 、 数 据 共享 服务 能 力 、 数 据 开放 规模 、 数 据 开发 能 力 、 
数据 共享 平台 质量 、 数 据 监管 机 制 、 数 据 评价 与 激励 机 制 、 财 政 支持 力度 
常量 感知 风险 、 感 知 努 力 、 感 知 利 益 、 感 知 成 就 、 数 据 存储 与 维护 机 制 、 数 据 审核 机 制 、 科 研 人 员 数 据 素养 、 机 构 数据 服务 质量 、 元 
数据 质量 、 数 据 处 理 能 力 、 数 据 整合 能 力 、 数 据 政策 完善 程度 、 数 据 价 值 增值 收益 


CUR 2023 年 第 35 卷 第 9 期 


影响 因素 系统 动力 学 模型 提出 基本 假设 ， 并 对 部 分 
参数 设置 说 明 。 

(1) 假设 科学 数据 价值 增值 影响 因素 系统 是 一 个 
各 子 系统 构成 要 素 频繁 互动 反馈 的 系统 ， 不 考虑 系统 
边界 以 外 的 因素 对 系统 的 影响 。 

(2) 假设 原始 数据 质量 、 数 据 存 缴 、 数 据 组 织 挟 
整合 等 因素 会 随 着 实践 的 积累 而 发 生 改 变 。 

(3) 假设 科学 数据 价值 增值 程度 可 以 通过 科学 数 
据 价值 增值 水 平 进行 量化 。 

(4) 构建 的 系统 动力 学 模型 具有 普 适 性 ， 不 考虑 
因 系 统 外 部 因 重 大 自然 灾害 、 重 大 政策 变革 等 非 正常 
情况 或 突 发 事件 所 引起 的 系统 崩溃 。 
5.3.3 仿真 方程 设 定 与 参数 设置 

科学 数据 价值 增值 系统 模型 运行 的 前 提 是 对 相关 
常量 以 及 变量 的 初始 值 进行 设 定 。 本 文 借鉴 高 晓 宁 了 外、 
袁 红 四 等 学 者 的 方法 ， 通 过 问卷 调查 获得 方程 所 涉及 
的 相关 指标 权重 以 及 部 分 变量 初始 值 。 问 卷 采 用 李 克 
特 十 级 量 表 ，1 到 10 分 别 表现 为 从 非常 不 同意 到 非常 
同意 ， 通 过 对 涉及 的 指标 变量 进行 打分 ， 计 算 各 题 的 
平均 分 作为 相应 指标 变量 的 影响 权重 。 为 了 保证 研究 
结论 的 一 致 性 ， 调 查 问 卷发 放 对 象 是 前 文 研究 选取 的 
18 名 访谈 人 员 。 问 卷 通 过 QQ、 微 信 、 邮 件 形 式 进行 
发 送 ， 回 收 周期 为 7 天， 回收 率 100%。 通 过 对 各 问卷 
的 分 值 进 行 整理 ， 利 用 层次 分 析 法 分 析 软 件 YAAHP 
对 打分 结果 进行 计算 获取 各 个 因素 的 权重 以 及 整体 一 
致 性 检验 结果 ， 对 18 名 专家 的 打分 结果 采用 算术 平均 
的 方法 来 获取 权重 。 经 计算 ， 一致 性 检验 指标 CR< 0， 


满足 研究 需求 。 
最 终 得 到 各 子 系统 中 影响 因素 权重 : 原始 数据 质 


量子 系统 (机构 数据 服务 质量 ，0.2; 科研 人 员 数 据 素 
养 ，0.45; 数据 软 硬 件 设施 ，0.35); 数据 存 缴 子 系统 
(数据 汇 交 意愿 ，0.3; 数据 存储 与 维护 机 制 ，0.2; 数 
据 审核 机 制 ，0.25; 科学 数据 价值 增值 水 平 ，0.05; 资 
金保 障 水 平 ，0.1; 数据 政策 与 监管 水 平 ，0.1); 数据 
组 织 与 整合 子 系统 (元 数据 质量 ，0.3; 数据 处 理 能 

0.25; 数据 整合 能 力 ，0.2; 科学 数据 价值 增值 水 平 ， 
0.05; 资金 保障 水 平 0.1; 数据 政策 与 监管 水 平 ， 
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0.1); 数据 共享 与 开发 子 系统 (数据 开发 能 力 ，0.14; 
数据 开放 规模 ，0.2; 数据 共享 服务 能 力 ，0.13; 数据 
共享 平台 质量 ，0.16; 数据 开放 风险 ，0.12; 科学 数据 
价值 增值 水 平 ，0.05; 资金 保障 水 平 ，0.1; 数据 政策 
与 监管 水 平 ，0.1); 数据 政策 与 监管 子 系统 (数据 政策 
完善 程度 ，0.45; 数据 评价 与 激励 机 制 ，0.3; 数据 监 
管 机 制 ，0.2; 科学 数据 价值 增值 水 平 ，0.05); 资金 保 
障 子 系统 (财政 支持 力度 ，0.5; 数据 价值 增值 收益 ， 
0.45; 科学 数据 价值 增值 水 平 ，0.05)。 

此 外 ， 感知 风险 、 感 知 努 力 、 感 知 利益 、 感 知 成 
就 、 数 据 存储 与 维护 机 制 、 数 据 审核 机 制 、 科 研 人 员 数 
据 素养 、 机 构 数 据 服务 质量 、 元 数据 质量 、 数 据 处 理 能 
力 、 数 据 整 合 能 力 、 数 据 政 策 完善 程度 、 数 据 价值 增值 
收益 等 常量 这 部 分 数值 采用 RANDOM UNIFORM 随机 
分 布 函 数 ， 并 设置 数值 区 间 为 [0.1] 。 

模型 中 涉及 的 主要 变量 方程 如 下 : 

(1) 科学 数据 价值 增值 水 平 = 原始 数据 质量 水 平 x 
0.25 + 数据 存 缴 水 平 x02 + 数据 组 织 与 整合 水 平 x0.16+ 
数据 共享 与 开发 水 平 x0.14 + 数据 政策 与 监管 水 平 x 
0.13 + 资金 保障 水 平 x 0.12 

(2) 原始 数据 质量 水 平 =INTEG (原始 数据 质量 水 
平 变化 量 ，0) 

(3) 原始 数据 质量 水 平 变化 量 =SMOOTHI (机 构 
数据 服务 质量 x 0.2 + 科研 人 员 数 据 素 养 x 0.45 + 数据 
软 硬 件 设施 x 0.35, 1, 0) 

(4) 数据 存 缴 水 平 =INTEG (数据 存 缴 水 平 变化 
i, 0) 

(5) 数据 存 缴 水 平 变 化 量 =SMOOTHI (数据 汇 交 
意愿 x 0.3+ 数据 存储 与 维护 机 制 x 0.2+ 数 据 审核 机 制 x 
0.25+ 科学 数据 价值 增值 水 平 x0.05 + 资金 保障 水 平 x 
0.1+ 数据 政策 与 监管 水 平 x 0.1, 1, 0) 


5.4 仿真 分 析 


5.4.1 模型 有 效 性 检验 

为 了 保证 所 构建 模型 的 有 效 性 ， 确 保 系统 模型 动 
态 仿真 的 顺利 开展 ， 本 研究 对 科学 数据 价值 增值 的 系 
统 动力 学 模型 进行 有 效 性 检验 ， 选 取 初 始 状态 下 的 科 
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学 数据 价值 增值 水 平 变 化 作为 有 效 性 检验 的 观测 指标 。 
通过 Vensim PLE 对 构建 的 科学 数据 价值 增值 影响 因素 
系统 流 图 进行 仿真 。 考 虑 到 科学 数据 价值 增值 过 程 并 
不 是 一 足 而 就 的 ， 而 是 需要 在 各 因素 的 作用 下 持续 推 
进 ， 因 此 ， 本 文 设置 仿真 时 间 周 期 为 12 个 月 ， 设 定时 
间 步 长 为 1 个 月 ， 科 学 数据 价值 增值 水 平 变化 趋势 如 
图 4 所 示 。 科 学 数据 价值 增值 水 平 在 前 期 维持 较 低 增 
KKF, ME 8 个 月 开始 科学 数据 价值 增值 水 平 趋势 
由 平缓 上 升 变 为 快速 上 升 趋势 ， 即 意味 着 从 目前 原始 
数据 质量 、 数 据 存 缴 、 数 据 组 织 与 整合 、 数 据 共享 和 
开发 、 数 据 政策 与 监管 、 资 金保 障 6 个 维度 入 手 进行 
科学 数据 管理 优化 ,那么 到 第 8 个 月 时 ， 科 学 数据 价 
值 增值 水 平 将 显现 出 优化 效果 。 从 当前 国内 外 知名 科 
学 数据 中 心 ， 如 中 国 的 国家 科学 数据 中 心 、 美 国 的 开 
放 科学 数据 中 心 等 ， 实 际 运 行情 况 来 看 ， 科 学 数据 价 
值 的 增值 主要 体现 在 数据 规模 、 质 量 、 应 用 价值 方面 
的 提升 ， 以 科学 数据 中 心 为 代表 的 主体 ， 其 数据 价值 
增值 过 程 涉 及 原始 数据 生产 、 数 据 存 缴 、 数 据 保存 、 
数据 组 织 、 数 据 整 合 、 数 据 开放 共享 、 数 据 开发 等 关 
键 活动 ， 这 些 活动 的 优化 本 身 需 要 一 定时 间 ， 继 而 产 
出 相应 的 效果 也 需要 一 定 周期 ， 这 与 前 期 科学 数据 价 
值 增值 水 平 较 低 相 呼 应 。 随 着 以 原始 数据 质量 提高 ， 
及 数据 存 缴 、 数 据 组 织 与 整合 、 数 据 共 享 与 开发 等 流 
程 体系 的 不 断 成 熟 、 科 学 数据 政策 与 监管 体系 的 不 断 
完善 ， 科 学 数据 价值 增值 效能 开始 显著 。 科 学 数据 价 
值 的 不 断 提 升 ， 进 一 步 促 进 科 学 数据 管理 过 程 完 善 ， 
实现 科学 数据 价值 增值 的 良性 循环 。 从 仿真 结果 可 以 
看 出 ， 科 学 数据 价值 增值 过 程 与 实际 情况 相符 ， 表 明 


模型 能 够 有 效 、 真 实地 反映 科学 数据 价值 增值 实现 的 
动态 变化 过 程 。 
5.4.2 ”情景 分 析 


本 研究 通过 改变 模型 中 原始 数据 质量 、 数 据 存 缴 、 
数据 组 织 与 整合 、 数 据 共 享 和 开发 、 数 据 政策 与 监管 、 
资金 保障 等 6 个 主要 参数 进行 灵敏 度 分 析 。 在 不 改变 
其 他 变量 参数 的 情况 下 ， 将 6 个 主要 参数 分 别 设置 为 
0.3、0.5、0.9， 仿 真得 出 各 影响 因素 相同 变化 量 时 ， 科 
学 数据 价值 增值 水 平 的 变化 趋势 ， 从 而 可 以 看 出 不 同 
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图 4 系统 动力 学 模型 有 效 性 分 析 


Fig.4 Effectiveness analysis of the system dynamics model 


影响 因素 对 科学 数据 价值 增值 水 平 的 影响 程度 。 根 据 
仿真 结果 (图 5)，6 个 影响 因素 对 科学 数据 价值 水 平 
的 影响 均 为 增加 量 。 其 中 原始 数据 质量 对 科学 数据 价 
值 水 平 影响 最 大 ， 其 次 是 数据 存 缴 、 数 据 组 织 与 整合 、 
数据 共享 与 开发 等 因素 ， 而 数据 政策 与 监管 、 资 金保 
障 等 辅助 支撑 因素 同样 对 科学 数据 价值 产生 正 向 作用 ， 
但 随 着 仿真 时 间 推 移 ， 其 影响 力 占 比 逐渐 减 小 。 
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图 5 各 影响 因素 对 科学 数据 价值 水 平 的 变动 效应 
Fig.5 The effect of each influencing factor on the value level of 
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N] 


(1) 科学 数据 收集 因素 。 由 图 6 可见， 原始 数据 BOFA, HER AL. AE 
质量 子 系统 中 按 影 响 程度 由 高 到 低 依次 为 科研 人 员 数 。 储 与 维护 机 制 。 但 由 于 科研 人 员 数 据 汇 交 意愿 的 提升 ， 
据 素养 、 数 据 软 硬 件 设 施 、 机 构 数 据 服务 质量 。 科 研 ” 以 及 数据 存储 相关 机 制 产生 作用 需要 一 个 积累 过 程 ， 

员 数 据 素养 水 平 对 原始 数据 质量 的 影响 占 主导 。 其 。” 所 以 前 期 数据 存储 水 平 变化 不 显著 ， 从 第 8 个 月 开始 
次 ,科学 数据 软 硬 件 设施 作为 保障 科学 数据 质量 的 物 。 数据 存储 水 平 才 不 断 提 升 ， 并 且 随 着 科研 人 员 数 据 共 
质 基 础 ， 对 科学 数据 质量 影响 显 车。 机构 数据 服务 质 ” 享 和 汇 交 意愿 的 不 断 提 高 ， 数 据 存 缴 相关 机 制 不 断 成 
量 水 平 提升 也 可 以 显著 提高 原始 数据 质量 。 如 图 7 所 ，” 熟 完善 ， 数 据 存 缴 水 平 增长 速率 不 断 提 升 。 


示 ， 数 据 存 缴 子 系统 中 ， 数 据 汇 交 意愿 对 科学 数据 存 (2) 科学 数据 组 织 与 开发 因素 。 观 察 图 8 可 以 发 
ne 现 ， 在 数据 组 织 整合 子 系统 中 ， 元 数据 质量 对 数据 组 

20 织 与 整合 水 平 的 正 向 促进 作用 更 为 显著 ， 数 据 处 理 能 
本 力 次 之 ,数据 融合 能 力促 进 作用 相对 最 小 。 总 体 而 言 ， 

| 二 一 ROPE REE 随 着 仿真 时 间 的 推进 ， 科 学 数据 中 心 等 科学 数据 共享 
x, 机 构 的 元 数据 质量 ， 以 及 数据 处 理 能 力 、 数 据 融合 能 

Par a 力 的 累积 增强 ， 科 学 数据 组 织 与 融合 水 平 从 第 7 个 月 

a ae 起 增长 迅速 ， 呈 指数 级 增长 。 数 据 共享 与 开发 子 系统 
aaa 中 ， 数 据 开 放 规模 、 数 据 共享 平台 质量 、 数 据 开发 能 

ee 力 、 数 据 共享 服务 能 力 对 科学 数据 价值 增值 产生 正 向 
gor 影响 ， 其 中 影响 程度 最 大 的 是 数据 开放 规模 ， 数 据 共 
Wiz 享 服务 能 力 影响 程度 最 小 。 而 数据 开放 风险 对 科学 数 
0 1 23456 789 211 2  ， 据 价值 增值 产生 反 向 抑制 作用 ,数据 开放 风险 越 高 ， 
eed, 数据 共享 与 开放 水 平 越 低 。 图 9 可见， 仿真 时 间 的 前 8 


图 6 原始 数据 质量 子 系统 关键 因素 影响 趋势 


Fig.6 Trends of key factors in the raw data quality subsystem 


个 月 ， 数 据 共享 与 开发 子 系统 中 各 因素 影响 并 不 显著 ， 
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8 个 月 之 后 各 因素 产生 的 作用 逐渐 明显 ， 这 是 因为 这 些 
因素 对 数据 共享 与 开发 水 平 的 影响 不 是 立竿见影 的 ， 
需要 一 段 时 间 积 累 之 后 才能 显示 出 显著 变化 。 
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图 9 数据 共享 与 开发 子 系统 关键 因素 影响 趋势 
Fig.9 Trends of key factors in the data sharing and development 


subsystem 


(3) 保障 因素 。 图 10 仿真 结果 可 见 ， 数 据 政策 与 
监管 子 系统 中 ， 关 键 因素 的 影响 程度 从 高 到 低 依次 为 
数据 政策 完善 程度 、 数 据 评价 与 激励 机 制 、 数 据 监管 
机 制 。 其 中 ， 数 据 政策 完善 程度 对 数据 政策 与 监管 水 


数据 政策 与 监管 水 平 
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图 10 政策 与 监管 子 系统 关键 因素 影响 趋势 
Fig.10 Influencing trend ofkey factors in the policy and 


regulatory subsystem 
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平 影响 最 为 显著 。 数 据 评 价 与 激励 机 制 、 数 据 监管 机 
制 的 影响 程度 区 别 不 大 。 图 11 仿真 结果 可 见 ， 提 升 财 
政 支 持 力度 对 资金 保障 水 平 的 作用 见效 更 快 ， 数据 价值 
增值 收益 的 增长 需要 一 段 时 间 的 发 展 积累 方 能 显现 , 但 
长 期 来 看 ， 数 据 价值 增值 收益 因素 更 具有 可 持续 性 。 
资金 保障 水 平 


+ Current 
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图 11 资金 保障 子 系统 关键 因素 影响 趋势 
Fig.11 The influencing trend of key factors in the fund guarantee 


subsystem 


6 结论 与 讨论 


本 研究 在 文献 收集 与 专家 访谈 获得 科学 数据 增值 
过 程 的 全 面 资 料 后 ， 通 过 扎根 理论 这 一 成 熟 的 质 性 研 
究 方 法 逐 级 归纳 得 出 科学 数据 价值 增值 影响 因素 理论 
模型 ， 在 此 基础 上 进行 系统 动力 学 仿真 ， 得 出 以 下 结 
论 : 巴 原 始 数据 质量 是 科学 数据 价值 增值 的 前 提 。 科 
研 人 员 为 代表 的 数据 生产 者 数据 素养 对 科学 数据 质量 
影响 最 为 显著 ， 科 研 人 员 的 数据 收集 和 处 理 能 力 、 数 
据 分 析 能 力 、 数 据 伦理 意 识 等 方面 的 提升 ， 可 以 显著 
提高 原始 数据 质量 。 四 数据 存 缴 水 平 对 科学 数据 价值 
增值 影响 显著 。 当 科研 人 员 数 据 存 缴 的 感知 努力 、 感 
知 风险 降低 ， 同 时 伴随 科学 数据 共享 政策 的 压力 ， 将 
会 促进 科研 人 员 提 高 存 缴 意愿 ， 进 而 显著 提升 数据 存 
缴 规模 效 应 。 加 科学 数据 组 织 与 整合 是 科学 数据 价值 
增值 形成 的 关键 。 总 体 上 对 科学 数据 组 织 与 整合 水 平 


影响 最 为 显著 的 是 元 数据 质量 。 元 数据 质量 是 科学 数 
据 加 工 、 分 类 、 融 合 的 基础 ， 元 数据 质量 越 高 越 有 助 
于 科学 数据 组 织 与 整合 水 平 的 提升 。 外 科学 数据 共享 
与 开发 是 科学 数据 价值 增值 实现 的 关键 ， 是 科学 数据 
价值 增值 实现 的 最 后 一 步 。 在 此 过 程 中 ， 科 学 数据 开 
放 规模 、 科 学 数据 共享 平台 质量 以 及 开发 能 力 都 对 科 
学 数据 共享 与 开发 水 平 产生 积极 促进 作用 。 

本 研究 全 局 性 地 、 动 态 地 对 科学 数据 增值 过 程 和 
关键 因素 加 以 揭示 。 运 用 系统 动力 学 模型 从 系统 的 角 
度 出 发 ， 考 虑 了 科学 数据 增值 过 程 相关 因素 之 间 的 相 
互 作用 和 联系 ， 避 免 了 现 有 相关 研究 无 法 用 实证 数据 
衡量 的 局 限 性 。 同 时 ， 为 开放 科学 数据 治理 实践 提供 
了 优化 科学 数据 价值 的 明确 目标 。 诚 然 ， 本 研究 虽 通 
过 专家 调研 、 文 献 调研 等 方式 收集 了 丰厚 的 质 性 数据 ， 
但 科学 数据 相关 实践 随 着 软 硬 件 环境 迅速 发 展 ， 具 有 
动态 性 、 复 杂 性 ， 因 此 ， 今 后 需要 进一步 运用 多 元 化 
方法 持续 跟踪 收集 科学 数据 价值 增值 的 影响 因素 ， 对 
本 研究 结论 进一步 验证 和 完善 。 


7 启 示 


基于 仿真 结果 ， 本 研究 针对 科学 数据 价值 增值 提 
出 以 下 策略 启示 。 

(1) 培育 数据 素养 ， 改 善 数 据 环 境 ， 提 升 科学 交 
据 质量 。 原 始 科学 数据 质量 ， 是 科学 数据 价值 增值 的 
基础 。 原 始 数据 质量 子 系统 中 ， 科 研 人 员 的 数据 素养 
很 大 程度 地 影响 了 原始 科学 数据 质量 。 因 此 ， 需 要 加 
强 对 科研 人 员 的 数据 素养 教育 ， 提 升 科研 人 员 获 取 、 
管理 、 利 用 数据 的 能 力 。 高 校 、 科 研 院 所 、 图 书馆 等 
主体 作为 开展 数据 素养 教育 的 主 阵地 ， 可 以 通过 科学 
数据 素养 通 识 教 育 、 学 科 专 题 数 据 素养 教育 等 教育 模 
式 ， 采 用 莫 课 、 在 线 课 程 、 培 训 、 咨 询 服务 等 丰富 形 
式 为 科研 人 员 提 供 便利 高 效 的 数据 素养 教育 。 科 学 数 
据 基 础 设施 是 科学 数据 价值 增值 的 重要 支撑 ， 科 学 数 
据 的 生成 与 组 织 、 存 储 、 利 用 都 依赖 完善 的 数据 环境 。 
应 注重 完善 科学 数据 基础 设施 建设 ， 立 足 科 学 数据 用 
户 需求 ， 完 善 科学 数据 平台 功能 ， 丰 富 相关 数据 处 理 


IAW, ERAN, RAE 


科学 数据 价值 增值 影响 因素 系统 动力 学 仿真 研究 


软件 、 数 据 存 储 服 务 ， 同 时 应 遵循 FAIR JU, REE 
础 设施 的 规范 化 、 互 操作 以 及 可 扩展 性 。 

(2) 着 力 动 机 激发 ， 聚 焦 机 制 完 善 ， 增 强 科学 数 
据 存 缴 水 平 。 在 科学 数据 存储 子 系统 中 ， 科 研 人 员 以 
及 科学 数据 管理 机 构 的 数据 汇 交 意愿 和 科学 数据 审核 
机 制 的 影响 程度 较 大 。 因 此 ， 可 以 倡导 与 宣传 提高 科 
学 数据 共享 氛围 使 科研 人 员 提 高 主观 规范 ; 尽快 建立 
科学 数据 共享 的 价值 认同 ， 以 及 科学 数据 汇 交 激励 政 
策 ， 提 升 科研 人 员 数 据 共享 的 感知 利益 。 从 而 以 激发 
科研 人 员 数 据 汇 交 动机 为 着 力 点 ， 突 破 当 前 科学 数据 
共享 困境 。 同 时 ， 科 学 数据 中 心 等 开放 数据 管理 和 服 
务 机 构 应 完善 审核 机 制 ， 制 定 科学 数据 质量 标准 和 相 
关 业 务 规则 ， 监 管 汇 交 至 科学 数据 中 心 的 数据 质量 ， 
进而 在 科学 数据 存储 环节 提高 科学 数据 价值 。 

(3) 关注 元 数据 质量 ， 着 力 数据 整合 ， 优 化 科学 
数据 组 织 和 整合 方式 。 元 数据 是 科学 数据 组 织 和 整合 
的 关键 因素 ， 具 备 高 质量 元 数据 的 科学 数据 更 容易 被 
组 织 和 利用 ， 因 此 ， 提 升 元 数据 质量 是 使 科学 数据 价 
值 增值 的 重要 手段 。 当 前 科学 数据 元 数据 标准 多 局 限 
于 科学 研究 或 科学 管理 的 某 一 阶段 ， 缺 乏 通 用 的 科学 
数据 元 数据 标准 。 需 要 面向 科学 数据 开放 共享 、 多 领 
域 互 操作 等 利用 需求 ， 在 核心 元 数据 的 基础 上 结合 学 
科 领 域 特点 合理 规划 科学 数据 的 元 数据 标准 ; 元 数据 
元 素 需 提高 完整 性 ， 应 覆盖 科学 数据 从 产生 到 组 织 、 
整合 、 开 发 利用 的 全 过 程 ， 使 数据 利用 者 了 解 科 学 数 
据 生 命 周期 过 程 。 同 时 ， 需 提供 配套 的 元 数据 服务 ， 
例如 ， 图 书馆 等 科学 数据 管理 服务 机 构 可 以 提供 在 线 
编辑 元 数据 的 免费 工具 ， 便 于 科研 人 员 便 捷 地 生成 高 
质量 元 数据 。 在 对 科学 数据 规范 化 标 引 与 描述 的 基础 
上 ， 建 立 多 维度 、 多 领域 、 多 形态 科学 数据 知识 关联 ， 
促进 开放 科学 环境 下 跨 学 科 跨 领域 的 科学 创新 。 

(4) 扩大 开放 规模 ， 优 化 开放 服务 ， 提 升 科 学 数 
据 开 发 利用 能 力 。 科 学 数据 中 心 等 科学 数据 管理 和 服 
务 机 构 应 扩大 科学 数据 开放 规模 ， 包 括 数量 规模 、 学 
科 领 域 以 及 更 丰富 的 元 数据 范围 、 开 放 接 口 等 等 ， 让 
更 多 科学 数据 可 发 现 、 可 访问 、 可 互 操作 是 科学 数据 
实现 价值 增值 的 前 提 。 在 此 基础 上 ， 优 化 科学 数据 开 
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放 服 务 ， 建 设 集 开放 、 监 管 、 服 务 、 交 易 、 交 换 多 功 
能 于 一 体 的 科学 数据 平台 ， 积 极 探索 和 培育 科学 数据 
相关 利益 主体 互惠 共生 模式 ， 开 展 科 学 数据 的 深度 挖 
据 和 增值 应 用 ,促使 科学 数据 价值 最 大 化 。 可 以 通过 
需求 导向 或 利益 驱动 等 多 种 方式 ， 利 用 云 计算 、 人 工 
智能 等 新 兴 数 字 技术 ， 在 保障 国家 数据 安全 和 相关 主 
体 知识 产权 的 前 提 下 ， 探 索 科学 数据 产品 和 增值 服务 
的 市 场 化 模式 ， 顺 应 科学 数据 作为 生产 要 素 参 与 市 场 
分 配 的 新 趋势 。 例 如 可 以 以 江苏 省 等 长 三 角 区 域 为 试 
点 ， 充 分 整合 区 域 科技 、 科 研 数 据 资源 ， 建 设 一 体 化 
科学 数据 平台 ， 配 套 激励 政策 吸引 机 构 、 数 据 科 学 家 、 
社会 公众 积极 参与 数据 产品 化 开发 ， 豆 励 应 用 创新 ; 
明确 参与 主体 的 权利 与 业务 规范 ， 促 进 区 域 科学 数据 
实现 商业 化 流通 。 
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Abstract: [Purpose/Significance] To explore the influencing factors of the added value of scientific data and reveal the inherent 
development laws of the added value of scientific data. [Method/Process] First, based on the interview data of 18 experts and the 
research results related to the value appreciation of scientific data in existing literature, the grounded theory method was adopted. 
Through open coding, main-axis coding, and selective coding, 19 categories, 6 main categories, and 3 core categories were finally 
obtained. From this, a theoretical model of the factors influencing the value appreciation of scientific data was obtained. On this basis, 
the Vensim PLE tool was used to establish a dynamic model of the value appreciation system of scientific data, and the process of value 
appreciation of scientific data was dynamically simulated and analyzed to reveal the relationship between various influencing factors and 
the value appreciation of scientific data. [Results/Conclusions] In the process of increasing the value of scientific data, the quality factor 
of raw data is a prerequisite, and high-quality raw scientific data are conducive to the integration and secondary development of 
subsequent scientific data. The data literacy of data producers represented by researchers has the most significant impact on the quality 
of scientific data. The level of data storage and payment has a significant impact on the added value of scientific data. When the 
perceived effort and perceived risk of data storage and payment by researchers decrease, accompanied by the pressure of scientific data 
sharing policies, researchers become more likely to increase their willingness to save and pay, thereby significantly improving the scale 
effect of data storage and payment. The organization and integration of scientific data is the key to the formation of value-added 
scientific data. Overall, the metadata quality has the most significant impact on the level of scientific data organization and integration. 
The quality of metadata is the foundation of scientific data processing, classification, and integration. The higher the quality of metadata, 
the more it helps to improve the level of scientific data organization and integration. The sharing and development of scientific data is 
the key to realizing the value-added of scientific data. It is the final step in realizing the value-added of scientific data. In this process, the 
scale of scientific data openness, the quality of scientific data sharing platforms, and development capabilities all have a positive 
promoting effect on the level of scientific data sharing and development. 


Keywords: scientific data; value increment; influencing factors; system dynamics; data elements; FAIR 


2023 年 第 35 卷 第 9 期 


